En aquest capìtol soc tècnic dels Marines de la Coalició i tinc que utilitzar un algorisme, LBPH d'OpenCV per reconèixer cares i restringir l'accés a un laboratori. El comandant vol limitar l'accés només a ell. L'algorisme utilitza números per representar característiques facials i compara aquestes representacions per reconèixer cares.
LBPH, que significa Local Binary Pattern Histograms, és un algoritme que ajuda a reconèixer cares en imatges. És com si fes un "escaneig" de la cara i enregistrés els detalls importants per a reconèixer-la. LBPH compara cada punt d'una imatge amb els seus punts que té al costat. A cada punt li dóna un número binari basant-se en si és més gran o igual que el punt central.
LBPH utilitza aquests patrons binaris locals per crear un histograma que és com una llista que mostra quants cops apareix cada patró.
Al codi del meu capítol podem veure que utilitza haarcascade_frontalface_default.xml
, que és un fitxer que ensenya a la computadora a “trobar” o “identificar” cares a les fotos. És com un manual que li “ensenya” com reconèixer cares fent una cerca de patrons de llum i ombra específics. És útil per als programes que volen identificar cares a les imatges com en el nostre cas.
Aprofito per explicar també la diferencia entre un .html
i un .xml
: L'XML (eXtensible Markup Language) s'utilitza per emmagatzemar i transportar dades estructurades i llegibles. HTML (Hypertext Markup Language), en canvi, s'utilitza per crear pàgines web i mostrar contingut als navegadors.
També he hagut de entrenar el reconeixedor de cares (foto 1). L'algorisme, LBPH, analitza cadascuna de les imatges d'entrenament i després escriu els resultats a un fitxer YAML (.yml), un llenguatge de serialització de dades llegible per humans que s'utilitza per a l'emmagatzematge de dades. YAML originalment significava "Un altre marcat més Language”, però ara significa “YAML Ain't Markup Language” per assenyalar que és més que una simple eina de marcatge de documents.
Una altra cosa important que hem de saber és que el programa converteix la imatge a escala de grisos per fer més fàcil i simplificar el processament.La conversió a escala de grisos es fa amb l'ús de cv.IMREAD_GRAYSCALE en la funció cv.imread. Això significa que cada imatge es carrega i es processa en escala de grisos abans de ser utilitzada pel reconeixedor facial, reduint la quantitat d'informació a manejar. En convertir la imatge a escala de grisos, es treballa només amb nivells de gris en lloc de colors complets, facilitant l'anàlisi de les característiques de la imatge i millorant l'eficiència de l'algorisme de reconeixement facial.